プロダクトを5年間運用したチームの歴史 – 長く続くチームづくり – #scrumosaka
Scrum Fest Osakaとは?
2020年6月26(金)・27日(土)にScrum Fest Osakaがオンラインで開催されました。 Scrum Fest Osaka 2020@ONLINEは以下のようなイベントです。クラスメソッドではシルバースポンサーとして協賛を行いました。
Scrum Fest Osakaはスクラムの初心者からエキスパート、ユーザー企業から開発企業、立場の異なる様々な人々が集まる学びの場です。この2日間を通じ、参加社同士でスクラムやアジャイルプラクティスについての知識やパッションをシェアするだけでなく、ここで出会ったエキスパートに困りごとを相談することもできます。
プロダクトを5年間運用したチームの歴史 - 長く続くチームづくり -
本記事は、セッション「プロダクトを5年間運用したチームの歴史 - 長く続くチームづくり -」をレポートします。
スピーカー
Daisuke Kasuya
Web Application Engineer/ Manager Hatena Co., Ltd.
セッション概要
Mackerelというプロダクトはローンチから5年が経ちました。
ぼくはそのほぼすべての期間、このチームに在籍していて、うち3年間はマネージャーとしてチームを運営しています。
5年間運用されたチームではさまざまなことが起こりますが、いくつか事例をご紹介しながら、長く安定的に続くチームづくりについて考えていきたいと思います。
レポート
株式会社はてなの粕谷さんが、自信がディレクレターを務めるMackerelのサービス運用を元にプロダクトを長く運用させる方法を3つの要点にしぼり話をされていました。
[変化し続ける周辺環境とシステム]
「動いているシステムは触るな」はもう過去の話で、今は「動かし続けるために触り続ける」こと。
- OSのメジャーアップデート。
- ブラウザのアップデート。
- 新たに発見される脆弱性。
クラウドサービスだけに限らす、およそ毎日 から およそ年1回 のペースまで様々に周辺環境は変化している。
それらに対応し、常にシステムを更新し続けるコツをつかむことが大切です。
そのためには、CI/CDの整備(テスト・デプロイの自動化)や、DevOpsの構築(開発と運用の融合) などを実施するのが良い。
[人の入れ替わりへの対処]
システムを維持するのは人。
チーム異動や退職などで人は入れ替わるもので、人の入れ替わりによって失われるものはたくさんあります。
- その人と過ごすかけがえのない日々。 SNSなどで繋がりを維持。
- その人が持っているプロダクト固有のスキルやドメイン知識。 スキルマップ、障害対応演習、年式遷宮。
かけがえのない日々...は、思い出として残っているのでヨシとして、 大事なのは、その人固有が持っているスキルの方です。
・メンバが固有で保持しているスキルマップを作成する
チームのスキルバランスや学習目標の指針にもなる効果が得られます。
「評価には使わない」「他のチームと比べない」など、スキルマップの維持のコツについても話されていました。
・障害対応演習を実施する
障害対応の際、古参メンバーの独壇場となり、新規メンバがなかなか入り込めないことがよくある。
- ステージング環境をわざと壊して復旧させてみる。
- DBを意図的に壊して復旧させてみる。
など、新規メンバーには、実際に発生した障害を再現して対応させてみる。
・式年遷宮
技術的負債から式年遷宮を意識する。
エンジニアの技術継承をメインの目的としており、式年遷宮をやっているとスキルマップの作成にも繋げることができる。
[技術的負債とシステムのスケール]
サービスの成長速度やシステム基盤技術の周辺環境の変化から、一定間隔で一定のタイミングでシステムの根本に手を入れる。 式年遷宮もこれに繋がるところがあります。
まとめ
・ 10年続く”プロダクト”と それを支える”人”を維持し続ける工夫。
人の成長がプロダクトを長く運用していくコツでもありますね。
障害対応演習の話の中で、 有給休暇中にランチをとっていたら、障害対応にSlack通知が来て、慌てて家に帰宅したら 「実は演習でした(笑)」 と言う話をしていましたが、似た経験をしたことがあり、笑いながら聞ける楽しいワークショップでした!